Авторы |
Алимурадов Алан Казанферович, соискатель ученой степени кандидата технических наук,
кафедра информационно-измерительной техники, Пензенский государственный университет,
alansapfir@yandex.ru
Чураков Петр Павлович, доктор технических наук, профессор, кафедра информационно-измерительной техники, Пензенский государственный университет, iit@pnzgu.ru
Тычков Александр Юрьевич, кандидат технических наук, директор студенческого научно-производственного бизнес-инкубатора (СНПБИ), Пензенский государственный университет,
tychkov_a@pnzgu.ru
|
Аннотация |
Рассмотрен вопрос выбора оптимального количества информативных параметров при решении задачи голосового управления. Статья состоит из трех частей. Первая часть содержит обзор основы акустики речи и речеобразования. Приведены основные понятия акустики речи и их физический смысл. Вторая часть содержит обзор информативных параметров, характеризующих речевые сигналы. Показано, что акустические характеристики голоса могут быть условно разделены на пять категорий: просодические, динамические, фонационные, спектральные и энергетические. В третьей части кратко рассмотрены классификация систем распознавания речи и параметры системы голосового управления. Приведены наиболее эффективные информативные параметры речевых
сигналов, применяемых в системе голосового управления.
|
Список литературы |
1. Фант, Г. Акустическая теория речеобразования / Г. Фант ; пер. с англ. Л. А. Варшавского, В. И. Медведева ; науч. ред. В. С. Григорьева. – М. : Наука, 1964. – 284 с.
2. Ли, У. А. Методы автоматического распознавания речи : в 2 кн. / У. А. Ли, Э. П. Нейбург, Т. Б. Мартин [и др.] ; пер. с англ. под ред. У. Ли. – М. : Мир, 1983. – Кн. 1. – 328 с.
3. Schuller, B. Recognising realistic emotions and affect in speech: State of the art and lessons learnt from the first challenge / B. Schuller, A. Batliner, S. Steidl, D. Seppi // Speech Communication, In Press.
4. El Ayadi, M. Survey on speech emotion recognition: Features, classification schemes, and databases
/ M. El Ayadi, M. S. Kamel, F. Karray // Pattern Recognition. – 2011. – V. 44, № 3. –Р. 572–587.
5. Рылов, А. С. Анализ речи в распознающих системах / А.С. Рылов. – Минск : Бест-принт,2003.– 264с.
6. Рабинер, Л. Р. Цифровая обработка речевых сигналов : пер. с англ. / Л. Р. Рабинер, Р. В. Шафер. – М. : Радио и связь, 1981. – 496 с.
7. Давыдов, А. Г. Выбор оптимального набора информативных признаков для классификации эмоционального состояния диктора по голосу / А. Г. Давыдов, В. В. Киселев, Д. С. Кочетков, А. В. Ткаченя // Диалог-2012 : сб. тр. междунар. конф. по компьютерной лингвистике. – 2011. – Т. 1, № 11. – С. 122–128.
|